from time import sleep

from lxml import etree
from selenium import webdriver

if __name__ == "__main__":
    # 实例化一个浏览器对象（传入浏览器的驱动程序）
    bro = webdriver.Chrome(executable_path="./chromedriver")
    # 隐性等待，最长等20秒
    bro.implicitly_wait(20)
    # 让浏览器发起一个指定URL的请求
    bro.get("http://scxk.nmpa.gov.cn:81/xk/")

    # page_source获取浏览器当前页面的源码数据
    page_text = bro.page_source

    # 解析企业名称
    tree = etree.HTML(page_text)
    li_list = tree.xpath('//ul[@id="gzlist"]/li')
    for li in li_list:
        name = li.xpath('./dl/@title')[0]
        print(name)
    sleep(5)
    bro.quit()
